![]() 用於操作通訊裝置的視訊編碼器的裝置和方法
专利摘要:
本發明的預測尺寸單元係根據視訊編碼而發信號。根據視訊編碼,可執行各種二值化。根據與不同的切片(例如,I、P、B切片)相關的編碼,一個或多個二元樹可用於進行各種相應的操作(例如,編碼單元預測和預測單元分割模式操作)。在一個實施方式中,針對P切片和B切片,共同的或單個的二元樹用於用單個語法元素對編碼單元預測和預測單元分割模式共同地編碼。即,共同的或單個的二元樹可用於編碼單元預測和預測單元分割模式。可在編碼器/發射器裝置和解碼器/接收器裝置之間進行適當的協作,以確保適當地處理視訊編碼的各個不同階段。 公开号:TW201315242A 申请号:TW101131389 申请日:2012-08-29 公开日:2013-04-01 发明作者:Pei-Song Chen;Brian Heng;Wade K Wan 申请人:Broadcom Corp; IPC主号:H04N19-00
专利说明:
用於操作通訊裝置的視訊編碼器的裝置和方法 本發明整體上涉及數位視訊處理;更具體地說,本發明涉及根據這種數位視訊處理而發信號(signaling)。 已經連續多年研究了用於傳送數位媒體(例如,圖像、視訊、資料等等)的通訊系統。相對於使用某種形式的視訊資料的這種通訊系統,以某個幀(frame)速率(例如,每秒幀)輸出或顯示大量的數位圖像,以便實現適合於輸出和消耗的視訊信號。在使用視訊資料進行操作的多個這種通訊系統內,在吞吐量(例如,可從第一位置發射到第二位置的圖像幀的數量)和最終要輸出或顯示的信號的視訊和/或圖像品質之間可進行平衡(trade-off)。現有技術未充分或可接受地提供一種裝置,通過該裝置,隨著提供充分的或可接受的視訊和/或圖像品質,可將視訊資料從第一位置傳送至第二位置,從而確保與通訊相關聯的費用相對較低、在通訊鏈路(links)的各個端部的通訊裝置的複雜性相對較低等。 根據本發明的一實施方式,提供了一種裝置,包括:視訊編碼器,用於對輸入視訊信號進行編碼,以產生輸出位元流(bit stream);並且其中:視訊編碼器使用單個二元樹用於隨著產生輸出位元流處理至少一個P切片(slice)和至少一個B切片;視訊編碼器針對至少一個P切片和至少一個B切片使用單個二元樹,以隨著產生輸出位元流用第一語法元素(syntax element)對編碼單元(CU)預測進行編碼;以及視訊編碼器針對至少一個P切片和至少一個B切片使用單個二元樹,以隨著產生輸出位元流用第二語法元素對預測單元(PU)分割模式進行編碼。 此外,根據該實施方式,第一語法元素表示幀內預測處理或幀間預測處理;以及第二語法元素表示CU分割形狀。 此外,根據該實施方式,視訊編碼器隨著產生輸出位元流而在第一時間或在第一時間期間執行幀內預測處理;以及視訊編碼器隨著產生輸出位元流而在第二時間或在第二時間期間執行幀間預測處理。 此外,根據該實施方式,該裝置為第一通訊裝置;並且進一步包括:第二通訊裝置,經由至少一個通訊通道與第一通訊裝置進行通訊,包含:輸入端,用於接收輸出位元流;以及視訊解碼器,用於對輸出位元流進行解碼,以產生與輸入視訊信號相對應的輸出視訊信號;並且其中:第二通訊裝置為電腦、筆記型電腦、高解析度(HD)電視、標準解析度(SD)電視、手持(handheld)媒體單元、機上盒(STB)、以及數位視訊光碟(DVD)播放器中的至少一個。 此外,根據該實施方式該裝置為在衛星通訊系統、無線通訊系統、有線通訊系統、光纖通訊系統以及移動通訊系統中的至少一個內進行操作的通訊裝置。 根據本發明的另一實施方式,還提供了一種裝置,包括:視訊編碼器,用於對輸入視訊信號進行編碼,以產生輸出位元流;並且其中:視訊編碼器使用單個二元樹,用於隨著產生輸出位元流來處理至少一個P切片和至少一個B切片。 此外,根據該另一實施方式,視訊編碼器針對至少一個P切片和至少一個B切片使用單個二元樹,以隨著產生輸出位元流用單個語法元素對編碼單元(CU)預測和預測單元(PU)分割模式共同地編碼。 此外,根據該另一實施方式,視訊編碼器針對至少一個P切片和至少一個B切片使用單個二元樹,以隨著產生輸出位元流用第一語法元素對編碼單元(CU)預測進行編碼;以及視訊編碼器針對至少一個P切片和至少一個B切片使用單個二元樹,以隨著產生輸出位元流用第二語法元素對預測單元(PU)分割模式進行編碼。 此外,根據該另一實施方式,第一語法元素表示幀內預測處理或幀間預測處理;以及第二語法元素表示CU分割形狀。 此外,根據該另一實施方式,視訊編碼器隨著產生輸出位元流而在第一時間或在第一時間期間執行幀內預測處理;以及視訊編碼器隨著產生輸出位元流而在第二時間或在第二時間期間執行幀間預測處理。 此外,根據該另一實施方式,該裝置為第一通訊裝置;並且進一步包括:第二通訊裝置,經由至少一個通訊通道與第一通訊裝置進行通訊,包含:輸入端,接收輸出位元流;以及視訊解碼器,對輸出位元流進行解碼,以產生與輸入視訊信號相對應的輸出視訊信號。 此外,根據該另一實施方式,第二通訊裝置為電腦、筆記型電腦、高解析度(HD)電視、標準解析度(SD)電視、手持媒體單元、機上盒(STB)、以及數位視訊光碟(DVD)播放器中的至少一個。 此外,根據該另一實施方式,該裝置為在衛星通訊系統、無線通訊系統、有線通訊系統、光纖通訊系統以及移動通訊系統中的至少一個內進行操作的通訊裝置。 根據本發明的又一實施方式,提供了一種用於操作通訊裝置的視訊編碼器的方法,該方法包括:操作視訊編碼器,用於對輸入視訊信號進行編碼以產生輸出位元流;以及在視訊編碼器內使用單個二元樹,用於隨著產生輸出位元流來處理至少一個P切片和至少一個B切片。 此外,根據該又一實施方式,在視訊編碼器內針對至少一個P切片和至少一個B切片使用單個二元樹,以隨著產生輸出位元流用單個語法元素對編碼單元(CU)預測和預測單元(PU)分割模式共同地編碼。 此外,根據該又一實施方式,該方法還包括:針對至少一個P切片和至少一個B切片使用單個二元樹,以隨著產生輸出位元流用第一語法元素對編碼單元(CU)預測進行編碼;以及針對至少一個P切片和至少一個B切片使用單個二元樹,以隨著產生輸出位元流用第二語法元素對預測單元(PU)分割模式進行編碼。 此外,根據該又一實施方式,第一語法元素表示幀內預測處理或幀間預測處理;以及第二語法元素表示CU分割形狀。 此外,根據該又一實施方式,該方法還包括:隨著產生輸出位元流而在第一時間或在第一時間期間執行幀內預測處理;以及隨著產生輸出位元流而在第二時間或在第二時間期間執行幀間預測處理。 此外,根據該又一實施方式,該方法還包括:操作另一通訊裝置,該另一通訊裝置通過以下步驟經由至少一個通訊通道而與該通訊裝置進行通訊:接收輸出位元流;以及操作視訊解碼器以對輸出位元流進行解碼,從而產生與輸入視訊信號相對應的輸出視訊信號,其中,該另一通訊裝置為電腦、筆記型電腦、高解析度(HD)電視、標準解析度(SD)電視、手持媒體單元、機上盒(STB)、以及數位視訊光碟(DVD)播放器中的至少一個。 此外,根據該又一實施方式,該通訊裝置在衛星通訊系統、無線通訊系統、有線通訊系統、光纖通訊系統以及移動通訊系統中的至少一個內進行操作。 在使用數位媒體(例如,數位視訊)的多個裝置內,使用像素(pixels)來表示這些裝置各自的圖像,這些圖像實質上為數位圖像。在某些通訊系統內,可將數位媒體從第一位置發射到第二位置,在該第二位置可輸出或顯示這種媒體。數位通訊系統(包括操作以便傳送數位視訊的那些通訊系統)的目的在於將數位資料從一個位置或子系統中發射到沒有誤差或具有較低的可接受的誤差率的另一個位置或子系統中。如圖1中所示,在各種通訊系統內,通過各種通訊通道(例如:磁性媒體、以及有線、無線、光纖、銅和/或其他類型的媒體)可發射資料。 圖1和圖2分別為顯示了通訊系統100和200的各種實施方式的示意圖。 參考圖1,通訊系統100的這個實施方式為通訊通道199,該通訊通道將位於通訊通道199的一端的通訊裝置110(包括具有編碼器114的發射器112和具有解碼器118的接收器116)通訊地耦接至位於通訊通道199的另一端的另一通訊裝置120(包括具有編碼器128的發射器126和具有解碼器124的接收器122)。在某些實施方式中,通訊裝置110和120中的任一個可僅包括發射器或接收器。存在幾種不同的媒體,通過該媒體,可使用通訊通道199(例如,使用碟形衛星天線(satellite dish)132和134的衛星通訊通道130、使用塔142和144和/或本地天線152和154的無線通訊通道140、有線通訊通道150、和/或使用電光(Electrical to Optical,E/O)介面162和光電(Optical to Electrical,O/E)介面164的光纖通訊通道160)。此外,可使用一種以上的媒體,並將其結合在一起,從而形成通訊通道199。 要注意的是,在不背離本發明的範圍和精神的情況下,這種通訊裝置110和/或120可為固定或移動式。例如,通訊裝置110和/或120可在固定的位置內使用,或者可為移動通訊裝置,能夠與一個以上的網路存取點相關聯和/或連通(例如,包括一個或多個無線區域網路(WLAN)的移動通訊系統中的各個不同的存取點(AP)、包括一個或多個衛星的移動通訊系統中的各個不同的衛星、或者通常為包括一個或多個網路存取點的移動通訊系統中的各個不同的網路存取點,通過這些存取點,通訊裝置110和/或120可實現通訊)。 為了減少通訊系統內不期望產生的傳輸誤差,通常使用誤差校正和通道編碼方案。通常,這些誤差校正和通道編碼方案包括在通訊通道199的發射器端使用編碼器以及在通訊通道199的接收器端使用解碼器。 在任何這種所需要的通訊系統(例如,包括圖1中所述的那些變化)、任何資訊儲存裝置(例如,硬碟(HDD)、網路資訊儲存裝置和/或伺服器等等)、或需要進行資訊編碼和/或解碼的任何應用程式中,可使用各種ECC代碼中的任何一個代碼。 一般而言,考慮使用將視訊資料從一個位置或子系統傳送到另一個位置或子系統的通訊系統時,通常可將視訊資料編碼視為在通訊通道199的發射端進行編碼,並且通常可將視訊資料解碼視為在通訊通道199的接收端進行解碼。 同樣,儘管示意圖的實施方式顯示了能夠在通訊裝置110和120之間進行雙向通訊,但要注意的是,在某些實施方式中,通訊裝置110可僅包括視訊資料編碼能力,通訊裝置120可僅包括視訊資料解碼能力,反之亦然(例如,在單向通訊實施方式中,例如根據視訊廣播實施方式)。 參考圖2的通訊系統200,在通訊通道199的發射端,將資訊位元201(例如,尤其與一個實施方式中的視訊資料相對應)提供給發射器297,該發射器可用於使用解碼器和符號映射器(symbol mapper)220(分別可視為不同的功能區塊222和224)對這些資訊位元201進行編碼,從而產生提供給發射驅動器230的一系列離散值調變符號203,該發射驅動器使用DAC(數位/類比轉換器)232產生連續時間傳輸信號204並且使用發射濾波器234產生過濾的連續時間傳輸信號(transmit signal)205,該發射信號與通訊通道299基本上一致。在通訊通道299的接收端,將連續時間接收信號206提供給AFE(類比前級電路)260,該類比前級電路包括接收濾波器262(產生過濾的連續時間接收信號207)以及ADC(類比/數位轉換器)264(產生離散時間接收信號208)。度量(metric)發生器270計算度量209(例如,根據符號和/或位元),解碼器280使用該度量,最佳地估計在其內進行編碼的離散值調變符號和資訊位元210。 在每個發射器297和接收器298內,各種元件、模組、功能區塊、電路可在其內以任何所需要的方式進行結合。例如,該示意圖顯示了處理模組280a,包括編碼器和符號映射器220以及其內所有相關的相應元件,並且顯示了處理模組280b,包括度量發生器270和解碼器280以及其內所有相關的相應元件。這種處理模組280a和280b可為各自的積體電路。當然,在不背離本發明的範圍和精神的情況下,可交替地執行其他界限和集聚(grouping)。例如,發射器297內的所有元件可包含在第一處理模組或積體電路內,並且接收器298內的所有元件可包含在第二處理模組或積體電路內。或者,在其他實施方式中,可對每個發射器297和接收器298內的元件進行任何其他組合。 與上述實施方式一樣,這種通訊系統200可用於傳送視訊資料,將視訊資料從一個位置或子系統中傳送到另一個位置或子系統中(例如,通過通訊通道299從發射器297傳送至接收器298)。 以下圖3A至圖3H中所述的任何不同裝置可進行數位圖像和/或媒體的數位圖像和/或視訊處理,從而允許用戶觀看這種數位圖像和/或視訊。這些不同的裝置不包括詳細的裝置清單(list),在該清單內,可實行本文中所述的圖像和/或視訊處理,並且要注意的是,在不背離本發明的範圍和精神的情況下,可使用任何通用數位圖像和/或視訊處理裝置,以便進行本文中所述的處理。 圖3A顯示了電腦301的一個實施方式。電腦301可為桌上型(desktop)電腦、或主機的企業儲存裝置(例如伺服器),主機連接到儲存陣列,例如,獨立磁片冗餘陣列(RAID)、儲存路由器、邊界路由器、儲存開關和/或儲存導向器(director)。用戶能夠依然使用電腦301觀看數位圖像和/或視訊(例如,一系列數位圖像)。通常,電腦301上包含各種圖像和/或視訊查看程式和/或媒體播放器程式,從而允許用戶觀看這種圖像(包括視訊)。 圖3B顯示了筆記型電腦302的一個實施方式。這種筆記型電腦302可位於並且用於任何多種環境中。近年來,隨著筆記型電腦內處理能力和功能的日益增長,在本應使用先前高端的且更強大的桌上型電腦的多種情況下,使用筆記型電腦。與電腦301一樣,筆記型電腦302可包括各種圖像查看程式和/或媒體播放器程式,從而允許用戶觀看這種圖像(包括視訊)。 圖3C顯示了高解析度(HD)電視303的一個實施方式。很多HD電視303包括積體調諧器,從而允許接收和處理其上的媒體內容(例如,電視廣播信號)並且對其解碼。或者,有時,HD電視303從另一個源中接收媒體內容,該源例如可為數位視訊光碟(DVD)播放器、機上盒(STB),其接收和處理電纜和/或衛星電視廣播信號並且將其解碼。無論是否進行特定的使用,都可使用HD電視303,從而如本文中所述,進行圖像和/或視訊處理。一般而言,HD電視303能夠顯示HD媒體內容,並且通常用作具有16:9的寬螢幕縱橫比(aspect ratio)。 圖3D顯示了標準解析度(SD)電視304的一個實施方式。當然,SD電視304與HD電視303略相似,至少一個差別在於,SD電視304不能顯示HD媒體內容,並且SD電視304通常安裝成具有4:3的全螢幕縱橫比。儘管如此,甚至可使用SD電視304,進行本文中所述的圖像和/或視訊處理。 圖3E顯示了手持媒體單元305的一個實施方式。手持媒體單元305可用於提供通用儲存或圖像和/或視訊內容資訊儲存,例如,靜態影像壓縮標準(JPEG)檔、標記圖像檔格式(TIFF)、點陣圖(bitmap)、動態影像專家組織移動(MPEG)檔、Windows Media(WMA/WMV)文件、為用戶重播的MPEG4檔等其他類型的視訊內容、和/或可儲存在數位格式內的任何其他類型的資訊。過去,這種手持媒體單元主要用於儲存和重播音頻媒體;然而,這種手持媒體單元305可用於儲存和重播任何虛擬(virtual)的媒體(例如,音頻媒體、視訊媒體、攝影媒體等等)。而且,這種手持媒體單元305也可包括其他功能,例如積體通訊電路,用於進行有線和無線通訊。這種手持媒體單元305可用於進行本文中所述的圖像和/或視訊處理。 圖3F顯示了機上盒(STB)306的一個實施方式。如上所述,有時,STB 306可用於接收和處理提供給任何合適的顯示功能裝置(例如,SD電視304和/或HD電視303)的電纜和/或衛星電視廣播信號並且將其解碼。這種STB 306可單獨操作或與這種顯示功能裝置共同操作,從而進行本文中所述的圖像和/或視訊處理。 圖3G顯示了數位視訊光碟(DVD)播放器307的一個實施方式。在不背離本發明的範圍和精神的情況下,這種DVD播放器可為藍光DVD播放器、HD功能DVD播放器、SD功能DVD播放器、上採樣(up-sampling)功能DVD播放器(例如,從SD到HD等等)。DVD播放器可將信號提供給任何合適的顯示功能裝置,例如,SD電視304和HD電視303。DVD播放器305可用於進行本文中所述的圖像和/或視訊處理。 圖3H顯示了通用數位圖像和/或視訊處理裝置308的一個實施方式。再次,如上所述,上述這些不同的裝置不包括詳細的裝置清單,在該清單內,可實行本文中所述的圖像和/或視訊處理,並且要注意的是,在不背離本發明的範圍和精神的情況下,可使用任何通用數位圖像和/或視訊處理裝置308,以便進行本文中所述的圖像和/或視訊處理。 圖4、圖5和圖6為分別顯示視訊編碼結構的各種實施方式400、500和600的示意圖。 參考圖4的實施方式400,該圖中可見,一輸入視訊信號由視訊編碼器接收。在某些實施方式中,該輸入視訊信號包括編碼單元(CU)或巨集區塊(MB)。這種編碼單元或巨集區塊的尺寸可不同,並且可包括通常設置為方形的多個像素。在一個實施方式中,這種編碼單元或巨集區塊的尺寸為16×16像素。然而,通常要注意的是,巨集區塊可具有任何所需要的尺寸,例如,N×N像素,其中N為整數。當然,雖然在優選的實施方式中使用方形編碼單元或巨集區塊,但是某些實施方式可包括非方形編碼單元或巨集區塊。 該輸入視訊信號通常可與原始幀(或畫面)圖像資料對應。例如,原始幀(或畫面)圖像資料可進行處理,從而產生亮度(luma)和色度(chroma)樣本。在某些實施方式中,巨集區塊內的這組亮度樣本具有一個特定的設置(例如,16×16),並且這組色度樣本具有一個不同的特定的設置(例如,8×8)。根據本文中所述的實施方式,視訊編碼器逐區塊處理這種樣本。 然後,該輸入視訊信號進行模式選擇,通過該選擇,輸入視訊信號選擇性地進行幀內和/或幀間預測處理。一般而言,輸入視訊信號沿著壓縮路徑進行壓縮。未使用回授(例如,未根據幀間預測或幀內預測)進行操作時,通過壓縮路徑而提供該輸入視訊信號,從而進行變換操作(例如,根據離散餘弦變換(DCT))。當然,可選的實施方式中也可使用其他的變換,在該操作模式中,壓縮該輸入視訊信號本身。在進行壓縮時,壓縮路徑可利用人眼缺乏高頻率敏感度這一事實。 然而,通過選擇性地使用幀間或幀內預測視訊編碼,可沿著壓縮路徑使用回授。根據回授或預測的操作模式,該壓縮路徑在(能量較低)剩餘物(例如,差值)上進行操作,從目前巨集區塊中減去目前巨集區塊的預測值,得出該剩餘物。根據在指定的情況下使用哪種形式的預測,基於這種幀(或畫面)的至少一部分或基於至少一個其他幀(或畫面)的至少一部分,產生目前巨集區塊和該巨集區塊的預測值之間的剩餘物或差值。 然後,所產生的修改視訊信號沿著壓縮路徑進行變換操作。在一個實施方式中,離散餘弦變換(DCT)在一組視訊樣本(例如,亮度、色度、剩餘物等等)上進行操作,從而計算預定數量的基礎模式中每個模式各自的係數值。例如,一個實施方式包括64個基(basis)函數(例如,用於8×8樣本)。一般而言,不同的實施方式可使用不同數量的基函數(例如,不同的變換)。各個基函數(包括其合適的和選擇性的加權)的任意組合可用於表示指定的一組視訊樣本。在與視訊編碼相關的技術文獻(包括如上所述通過引用而併入的那些標準/草案(draft)標準)中,描述與進行變換操作的各種方法相關的額外的細節。變換處理的輸出包括各自的這種係數值。將該輸出提供給量化器(quantizer)。 一般而言,大部分圖像區塊通常會產生係數(例如,在根據離散餘弦變換(DCT)進行操作的一個實施方式中的DCT係數),從而最相關的DCT係數具有更低的頻率)。正因如此,並且由於人眼對高頻視覺效果具有較差的敏感度,所以量化器可操作,從而將大部分不太相關的係數變換成零值。即,根據量化過程,可消除相對貢獻低於某個預定值(例如,某個閾值)的那些係數。量化器也可操作,從而將重要的係數變換成可編碼的值,與變換過程中獲得的那些係數相比,該變換更有效。例如,由整數值分割每個係數並且丟棄任何剩餘物,從而該量化過程可進行操作。在普通的編碼單元或巨集區塊上進行操作時,這種步驟通常產生數量較少的非零係數,然後,根據回授路徑,可將這些非零係數傳送給熵(entropy)編碼器,以便進行無損的編碼和使用,根據視訊編碼,該回授路徑可選擇幀內預測和/或幀間預測處理。 熵編碼器根據無損的壓縮編碼處理進行操作。相比之下,量化操作通常有損。熵編碼處理在量化處理所提供的係數上進行操作。那些係數可表示各種特徵(例如,亮度、色度、剩餘物等等)。熵編碼器可使用各種編碼。例如,熵編碼器可進行基於上下文(context)的自適應二進位算術編碼(CABAC)和/或基於上下文的自適應可變長度編碼(CAVLC)。例如,根據至少一部分熵編碼方案,將資料變換成(列、行)配對(例如,資料14、3、0、4、0、0、-3會變換成各個(列、行)對(0,14),(0,3),(1,4),(2,-3))。可提前準備表格,為數值對分配可變的長度編碼,所以將較短的長度編碼分配給比較常見的數值對,並且將較長的長度編碼分配給不太常見的數值對。 讀者會理解的是,反量化和反變換操作分別對應於量化和變換操作。例如,在變換操作內使用DCT的實施方式中,反DCT(IDCT)用於反變換操作內。 圖像緩衝器或者稱為數位圖像緩衝器或DPB,從IDCT模組中接收信號;圖像緩衝器進行操作,從而儲存目前幀(或圖像)和/或一個或多個其他的幀(或圖像),例如根據幀內預測和/或幀間預測操作可使用這些幀,根據視訊編碼可進行這種預測操作。要注意的是,根據幀內預測,較小的儲存量即已足夠,這是因為,無需在幀(或圖像)序列內儲存目前幀(或圖像)或任何其他的幀(或圖像)。根據視訊編碼進行幀間預測時,可使用這種儲存的資訊,進行移動補償和/或移動估計。 在一個可能的實施方式中,為了進行移動估計,在幀(或圖像)序列內,將目前幀(或圖像)的各組亮度樣本(例如,16×16)與其他幀(或圖像)內各個緩衝的對應物進行比較(例如,根據幀間預測)。在一個可能的實施方式中,定位最近的匹配區域(例如,預測參考),並且產生向量偏移(例如,移動向量)。在單個幀(或圖像)內,可具有多個移動向量,並且並非所有的移動向量需要指向相同的方向。根據移動估計所進行的一個或多個操作進行操作,從而產生一個或多個移動向量。 進行移動補償的操作,從而使用一個或多個移動向量,根據移動估計可產生這些移動向量。識別並傳輸預測參考樣本組(set),希望試圖產生比較(例如,理想地,非常地)低的殘餘能量時,從原始輸入視訊信號中減去預測參考樣本組。如果這種操作不會產生更低的殘餘能量,那麼不需要進行移動補償,並且變換操作可僅僅在原始輸入視訊信號上進行操作,而不在剩餘物上進行操作(根據以下操作模式:將輸入視訊信號直接提供給變換操作,從而不進行幀內預測或幀間預測),或者可使用幀內預測,並且在幀間預測產生的剩餘物上進行變換操作。同樣,如果移動估計和/或移動補償操作成功,那麼可將移動向量與相應的剩餘物的係數一起發射給熵編碼器,用於進行無損的熵編碼。 整個視訊編碼操作的輸出為輸出位元流。要注意的是,通過產生可通過通訊通道發射的連續時間信號,這種輸出位元流當然可進行某種操作。例如,某些實施方式在無線通訊系統內進行操作。在這種情況下,輸出位元流可進行適當的數位/類比變換、頻率變換、縮放(scaling)、過濾、調變、符號映射、和/或無線通訊裝置內的任何其他的操作,進行這些操作,以便產生通過通訊通道能夠發射的連續時間信號,等等。 參考圖5的實施方式500,在該圖中可見,輸入視訊信號由視訊編碼器接收。在某些實施方式中,輸入視訊信號包括編碼單元或巨集區塊(和/或可分成為編碼單元(CUs))。這種編碼單元或巨集區塊的尺寸可不同,並且可包括通常設置為方形的多個像素。在一個實施方式中,這種編碼單元或巨集區塊的尺寸為16×16像素。然而,通常要注意的是,巨集區塊的可具有任何所需要的尺寸,例如,N×N像素,其中N為整數。當然,雖然在優選的實施方式中使用方形編碼單元或巨集區塊,但是某些實施方式可包括非方形編碼單元或巨集區塊。 上述輸入視訊信號通常被認為可與原始幀(或畫面)圖像資料對應。例如,原始幀(或畫面)圖像資料可進行處理,從而產生亮度和色度樣本。在某些實施方式中,巨集區塊內的亮度樣本組(a set of luma sample)具有一個特定的設置(例如,16×16),並且這組色度樣本具有一個不同的特定的設置(例如,8×8)。根據本文中所述的實施方式,視訊編碼器逐區塊(block by block)處理這種樣本。 然後,該輸入視訊信號進行模式選擇,通過該選擇,該輸入視訊信號選擇性地進行幀內和/或幀間預測處理。一般而言,該輸入視訊信號沿著壓縮路徑進行壓縮。未使用回授(例如,未根據幀間預測或幀內預測)進行操作時,通過壓縮路徑提供該輸入視訊信號,從而進行變換操作(例如,根據離散餘弦變換(DCT))。當然,可選的實施方式中也可使用其他的變換,在該操作模式中,壓縮該輸入視訊信號本身。在進行壓縮時,壓縮路徑可利用人眼缺乏高頻率敏感度這一事實。 然而,通過選擇性地使用幀間或幀內預測視訊編碼,可沿著壓縮路徑使用回授。根據回授或預測的操作模式,該壓縮路徑在(能量較低)剩餘物(例如,差值)上進行操作,從目前巨集區塊中減去目前巨集區塊的預測值,得出該剩餘物。根據在指定的情況下使用哪種形式的預測,基於這種幀(或畫面)的至少一部分或基於至少一個其他幀(或畫面)的至少一部分,產生目前巨集區塊和該巨集區塊的預測值之間的剩餘物或差值。 然後,所產生的修改視訊信號沿著壓縮路徑進行變換操作。在一個實施方式中,離散餘弦變換(DCT)在一組視訊樣本(例如,亮度、色度、剩餘物等等)上進行操作,從而計算預定數量的基礎模式中每個模式各自的係數值。例如,一個實施方式包括64個基函數(例如,用於8×8樣本)。一般而言,不同的實施方式可使用不同數量的基函數(例如,不同的變換)。各個基函數(包括其合適的和選擇性的加權)的任意組合可用於表示指定的一組視訊樣本。在與視訊編碼相關的技術文獻(包括如上所述通過引用而併入的那些標準/草案標準)中,描述與進行變換操作的各種方法相關的額外的細節。變換處理的輸出包括各自的這種係數值。將該輸出提供給量化器。 一般而言,大部分圖像區塊通常會產生係數(例如,在根據離散餘弦變換(DCT)進行操作的一個實施方式中的DCT係數),從而最相關的DCT係數具有更低的頻率)。正因如此,並且由於人眼對高頻視覺效果具有較差的敏感度,所以量化器可操作,從而將大部分不太相關的係數變換成零值。即,根據量化過程,可消除相對貢獻低於某個預定值(例如,某個閾值)的那些係數。量化器也可操作,從而將重要的係數變換成可編碼的值,與變換過程中獲得的那些係數相比,該變換更有效。例如,由整數值分割每個係數並且丟棄任何剩餘物,從而該量化過程可進行操作。在普通的編碼單元或巨集區塊上進行操作時,這種步驟通常產生數量較少的非零係數,然後,根據回授路徑,可將這些非零係數傳送給熵編碼器,以便進行無損的編碼和使用,根據視訊編碼,該回授路徑可選擇幀內預測和/或幀間預測處理。 熵編碼器根據無損的壓縮編碼處理進行操作。相比之下,量化操作通常有損。熵編碼處理在量化處理所提供的係數上進行操作。那些係數可表示各種特徵(例如,亮度、色度、剩餘物等等)。熵編碼器可使用各種編碼。例如,熵編碼器可進行基於上下文的自適應二進位算術編碼(CABAC)和/或基於上下文的自適應可變長度編碼(CAVLC)。例如,根據至少一部分熵編碼方案,將資料變換成(列、行)配對(例如,資料14、3、0、4、0、0、-3會變換成各個(列、行)對(0,14),(0,3),(1,4),(2,-3))。可提前準備表格,為數值對分配可變的長度編碼,所以將較短的長度編碼分配給比較常見的數值對,並且將較長的長度編碼分配給不太常見的數值對。 讀者會理解的是,反量化和反變換操作分別對應於量化和變換操作。例如,在變換操作內使用DCT的實施方式中,反DCT(IDCT)用於反變換操作內。 在某些可選的實施方式中,將去方塊(de-blocking)效應濾波器的輸出提供給一個或多個其他的環路內濾波器(例如,根據樣本自適應偏置(SAO)濾波器、自適應環路濾波器(ALF)、和/或任何其他的濾波器類型進行使用),使用這些濾波器處理反變換模組的輸出。 例如,這種自適應環路濾波器(ALF)可用於處理去方塊效應濾波器的輸出,或者這種ALF可用於處理首先從去方塊效應濾波器中接收輸出的樣本自適應偏置(SAO)濾波器的輸出。解碼的畫面儲存在畫面緩衝器(有時稱為DPB、數位畫面緩衝器)內之前,這種自適應環路濾波器(ALF)可用於解碼的畫面中。自適應環路濾波器(ALF)可用於減少解碼畫面的編碼噪音,並且無論是否逐片或逐區塊使用自適應環路濾波器(ALF),都可逐片地將其過濾選擇性地用於亮度和色度中。使用自適應環路濾波器(ALF)時,可使用二維(2-D)有限脈衝回應(FIR)。在編碼器處可逐區塊設計濾波器的係數,並且然後將這種資訊用信號發射給解碼器(從包括視訊編碼器(或者稱為編碼器)的發射器通訊裝置中用信號發射到包括視訊解碼器(或者稱為解碼器)的接收器通訊裝置中)。 一個實施方式進行操作,根據Wiener過濾設計,產生係數。此外,無論是否進行過濾,都在編碼器處逐區塊使用,並且然後,根據四元樹(quadtree)結構,將這種決定用信號發射給解碼器(例如,從包括視訊編碼器(或者稱為編碼器)的發射器通訊裝置用信號發射到包括視訊解碼器(或者稱為解碼器)的接收器通訊裝置中),其中,根據率(rate)失真最佳化,決定該區塊的尺寸。要注意的是,使用這種2-D過濾進行實施,通過編碼和解碼,會產生一定程度的複雜性。例如,根據和使用自適應環路濾波器(ALF),使用2-D過濾,在發射器通訊裝置內使用的編碼器以及在接收器通訊裝置內使用的解碼器內,會稍微增大複雜性。 相對於一種環路內濾波器,使用自適應環路濾波器(ALF),可根據這種視訊處理,提供大量的改進,包括通過隨機去除量化噪音,由峰值信號雜訊比(PSNR)提高客觀品質測量。此外,通過亮度補償,可實現隨後編碼的視訊信號的主觀(subjective)品質,通過根據自適應環路濾波器(ALF)進行偏置處理和縮放處理(例如,通過應用一增益),可產生這種亮度補償。 圖像緩衝器或者稱為數位圖像緩衝器或DPB,從ALF中接收信號輸出;圖像緩衝器進行操作,從而儲存目前幀(或圖像)和/或一個或多個其他的幀(或圖像),例如根據幀內預測和/或幀間預測操作可使用這些幀,根據視訊編碼可進行這種預測操作。要注意的是,根據幀內預測,較小的儲存量即已足夠,這是因為,無需在幀(或圖像)序列內儲存目前幀(或圖像)或任何其他的幀(或圖像)。根據視訊編碼進行幀間預測時,可使用這種儲存的資訊,進行移動補償和/或移動估計。 在一個可能的實施方式中,為了進行移動估計,在幀(或圖像)序列內,將目前幀(或圖像)的各組亮度樣本(例如,16×16)與其他幀(或圖像)內各個緩衝的對應物進行比較(例如,根據幀間預測)。在一個可能的實施方式中,定位最近的匹配區域(例如,預測參考),並且產生向量偏移(例如,移動向量)。在單個幀(或圖像)內,可具有多個移動向量,並且並非所有的移動向量需要指向相同的方向。根據移動估計所進行的一個或多個操作進行操作,從而產生一個或多個移動向量。 進行移動補償的操作,從而使用一個或多個移動向量,根據移動估計可產生這些移動向量。識別並傳輸預測參考樣本組,希望試圖產生比較(例如,理想地,非常地)低的殘餘能量時,從原始輸入視訊信號中減去預測參考樣本組。如果這種操作不會產生更低的殘餘能量,那麼不需要進行移動補償,並且變換操作可僅僅在原始輸入視訊信號上進行操作,而不在剩餘物上進行操作(根據以下操作模式:將輸入視訊信號直接提供給變換操作,從而不進行幀內預測或幀間預測),或者可使用幀內預測,並且在幀間預測產生的剩餘物上進行變換操作。同樣,如果移動估計和/或移動補償操作成功,那麼可將移動向量與相應的剩餘物的係數一起發射給熵編碼器,用於進行無損的熵編碼。 整個視訊編碼操作的輸出為輸出位元流。要注意的是,通過產生可通過通訊通道發射的連續時間信號,這種輸出位元流當然可進行某種操作。例如,某些實施方式在無線通訊系統內進行操作。在這種情況下,輸出位元流可進行適當的數位/類比變換、頻率變換、縮放、過濾、調變、符號映射、和/或無線通訊裝置內的任何其他的操作,進行這些操作,以便產生通過通訊通道能夠發射的連續時間信號,等等。 參考圖6的實施方式600,該圖描述了視訊編碼器的可選實施方式,這種視訊編碼器執行預測、變換以及編碼處理,從而產生壓縮的輸出位元流。這種視訊編碼器可根據一個或多個視訊編碼協定、標準和/或推薦的做法(practices)例如,ISO/IEC 14496-10-MPEG-4部分10,AVC(高級視訊編碼),可選地被稱為H.264/MPEG-4部分10或AVC(高級視訊編碼)、ITU H.264/MPEG4-AVC,進行操作並且與它們相符。 應注意的是,相應的視訊解碼器例如在通訊通道的另一端位於裝置內,其用於進行解碼、反變換和重新構成的補償處理,從而產生各個解碼的視訊序列,該視訊序列(理想地)表示該輸入視訊信號。 該圖中可見,可使用可選的裝置和結構,用於進行視訊編碼。一般而言,編碼器處理該輸入視訊信號(例如,在單位上通常由編碼單元或巨集區塊構成,通常為方形並且其內包括N×N像素)。視訊編碼根據先前編碼的資料確定目前巨集區塊的預測。這個先前編碼的資料可來自目前幀(或圖像)本身(例如,根據幀內預測)或來自已經編碼的(例如,根據幀間預測)一個或多個其他幀(或圖像)。視訊編碼器減去目前巨集區塊的預測,從而構成剩餘物。 一般而言,幀內預測進行操作,從而使用一個或多個特定尺寸(例如,16×16、8×8或4×4)的區塊尺寸,在相同幀(或圖像)內從周圍先前編碼的像素中預測目前巨集區塊。一般而言,幀間預測進行操作,以便使用一系列區塊的尺寸(例如,16×16向下到4×4),從選自一個或多個先前編碼的幀(或畫面)內的區域中,預測目前幀(或圖像)內的像素。 對於變換和量化操作,剩餘樣本的區塊可使用特定的變換(例如,4×4或8×8)進行變換。這種變換的一個可能實施方式根據離散餘弦變換(DCT)進行操作。變換操作輸出一組係數,從而每個係數對應於與變換相關的一個或多個基函數的各個權重值。進行變換之後,將變換係數的區塊量化(例如,每個係數可由整數值分割,並且可丟棄任何相關的剩餘物,或者可乘以整數值)。量化處理通常本質上有損,並且根據量化參數(QP)可降低變換係數的精度。通常,與指定巨集區塊相關的多個係數為零,並且僅僅剩下一些非零係數。通常,較高的QP設置進行操作,以便產生更大比例的零值係數以及更小幅度的非零值係數,在解碼的圖像品質較差的情況下,具有較高的壓縮(例如,較低的編碼位元率);較低的QP設置進行操作,從而允許量化後具有更多的非零係數以及更大幅度的非零係數,導致在具有較好的解碼圖像品質時,具有較低的壓縮(例如,較高的編碼位元率)。 視訊編碼處理產生大量的值,將這些值進行編碼,從而形成壓縮的位元率。這種值的實例包括量化的變換係數、解碼器用於重新產生適當的預測的資訊、有關編碼過程中使用的壓縮資料和壓縮工具的結構的資訊、有關整個視訊序列的資訊等。在根據CABAC、CAVLC或某個其他的熵編碼方案進行操作的熵編碼器內,這種值和/或參數(例如,語法元素)可進行編碼,以便產生可儲存、發射的輸出位元流(例如,進行適當的處理,產生與通訊通道一致的連續時間信號之後)等。 在使用回授路徑進行操作的一個實施方式中,該變換和量化的輸出進行反量化和反變換。根據視訊編碼,可進行幀內預測和/或幀間預測。同樣,根據這種視訊編碼,可進行移動補償和/或移動估計。 將從反量化和反變換(IDCT)區塊中輸出的信號路徑提供給幀內預測區塊,同樣也提供給去方塊效應濾波器。將去方塊效應濾波器的輸出提供給一個或多個其他環路內濾波器(例如,根據自適應環路濾波器(ALF)、樣本自適應偏置(SAO)濾波器、和/或任何其他的濾波器類型進行使用),使用這些濾波器處理反變換模組的輸出。例如,在一個可能的實施方式中,解碼的畫面儲存在畫面緩衝器(再次,有時可選地稱為DPB、數位畫面緩衝器)內之前,ALF可用於解碼的畫面中。該ALF可用於減少解碼畫面的編碼噪音,並且無論是否逐片或逐區塊使用ALF,都可逐片地將其過濾選擇性地用於亮度和色度中。使用ALF時,可使用二維(2-D)有限脈衝回應(FIR)。在編碼器處可逐區塊設計濾波器的係數,並且然後,將這種資訊用信號發射給解碼器(從包括視訊編碼器(或者稱為編碼器)的發射器通訊裝置用信號發射到包括視訊解碼器(或者稱為解碼器)的接收器通訊裝置中)。 一個實施方式根據Wiener過濾設計,產生係數。此外,無論是否進行過濾,都在編碼器處逐區塊使用,並且然後,根據四元樹(quadtree)結構,將這種決定用信號發射給解碼器(例如,從包括視訊編碼器(或者稱為編碼器)的發射器通訊裝置用信號發射到包括視訊解碼器(或者稱為解碼器)的接收器通訊裝置中),其中,根據率失真最佳化,決定該區塊的尺寸。要注意的是,使用這種2-D過濾進行實施,通過編碼和解碼,會產生一定程度的複雜性。例如,根據和使用ALF,使用2-D過濾,在發射器通訊裝置內使用的編碼器以及在接收器通訊裝置內使用的解碼器內,會稍微增大複雜性。 如其他實施方式中所述,使用ALF,可根據這種視訊處理,提供大量的改進,包括通過隨機去除量化的噪音,由峰值信號雜訊比(PSNR)提高客觀品質測量。此外,通過亮度補償,可實現隨後編碼的視訊信號的主觀品質,通過根據ALF進行偏置處理和縮放處理(例如,根據應用一增益的FIR過濾),可產生這種亮度補償。 對於用於產生輸出位元流的任何視訊編碼器結構而言,要注意的是,在多個通訊裝置內的任何裝置內,可使用這種結構。輸出位元流可進行額外的處理,包括誤差校正碼(ECC)、向前糾錯(FEC)等等,從而產生其內具有額外冗餘協議的經修改的輸出位元流。同樣,這種數位信號可理解的是,通過產生適合於或適用於通過通訊通道進行傳輸的連續時間信號,可進行任何適當的處理。即,在通訊裝置內可使用這種視訊編碼器結構,該通訊裝置進行操作,以便通過一個或多個通訊通道而傳輸一個或多個信號。在這種視訊編碼器結構所產生的輸出位元流上,可進行額外的處理,從而產生連續時間信號,可將該信號發射到通訊通道內。 圖7是顯示了幀內預測處理的一個實施方式700的示意圖。從該圖中可看出,視訊資料的目前區塊(例如,通常為方形並且通常包括N×N像素)進行處理,從而估計其內的各個像素。根據這種幀內預測,使用位於目前區塊的上面以及左邊的先前編碼的像素。從某些角度來看,可將幀內預測視為與向量對應,該向量從目前像素延伸到位於目前區塊的上面以及左邊的參考像素。在相應的標準內規定用於根據H.264/AVC進行編碼的幀內預測的細節(例如,國際電信聯盟,ITU-T,TELECOMMUNICATION STANDARDIZATION SECTOR OF ITU,H.264(03/2010),SERIES H:AUDIOVISUAL AND MULTIMEDIA SYSTEMS,視聽業務的基礎設施-移動視訊編碼,為通用視聽業務進行高級視訊編碼,Recommendation ITU-T H.264,也或者稱為International Telecomm ISO/IEC 14496-10-MPEG-4第10部分,AVC(高級視訊編碼),H.264/MPEG-4第10部分或AVC(高級視訊編碼),ITU H.264/MPEG4-AVC,或等同物),以上通過引用包含該標準。 該剩餘物為目前像素和參考或預測像素之間的差值,將該剩餘物進行編碼。從該圖中可見,在共同幀(或圖像)內,幀內預測使用像素進行操作。當然要注意的是,指定的像素可具有與其相關的不同的元件,並且可具有不同的幾組樣本,用於每個元件。 圖8是顯示了幀間預測處理的一個實施方式800的示意圖。與幀內預測相比,幀間預測進行操作,從而在目前幀(或畫面)內根據目前的一組像素以及在幀(或畫面)序列內根據一個或多個其他幀(或畫面)內的一組或多組參考或預測像素,識別移動向量(例如,幀間預測方向)。可見,移動向量在幀(或畫面)序列內從目前幀(或畫面)延伸到另一幀(或畫面)。幀間預測可使用子像素插值(interpolation),從而預測像素數值對應於參考幀或圖像內多個像素的函數。 雖然這種剩餘物與根據幀內預測處理計算的剩餘物不同,但是根據幀間預測處理可計算剩餘物。根據幀內預測處理,每個像素處的剩餘物再次對應於目前像素和預測的像素值之間的差值。然而,根據幀間預測處理,目前像素和參考或預測像素不位於相同的幀(或圖像)內。雖然該圖顯示了一個或多個先前幀或畫面使用的幀間預測,但是要注意的是,使用與目前幀之前和/或之後的幀對應的多種參考幀,可選的實施方式可進行操作。例如,根據適當的緩衝和/或記憶體管理,可儲存大量的幀。在指定幀上進行操作時,通過該指定幀之前和/或之後的其他幀,可產生多種參考幀。 與CU耦合,基本單元可用於預測分割模式,即,預測單元或PU。還要注意的是,限定PU,僅僅用於最後一個深度CU,並且其尺寸限於該CU的尺寸。 圖9和圖10為分別顯示了視訊解碼結構的各種實施方式900和1000的示意圖。 一般而言,這種視訊解碼結構在輸入位元流上進行操作。當然,要注意的是,通過通訊裝置從通訊通道中接收的信號,可產生這種輸入位元流。在從通訊通道中接收的連續時間信號上,可進行各種操作,包括數位取樣、解調制、縮放、過濾等等,例如,通過產生輸入位元流,這些操作可適合。而且,在某些實施方式中,可執行一種或多種誤差校正碼(ECC)、前向錯誤更正碼(FEC)等,這些實施方式可根據這種ECC、FEC等等進行適當的解碼,從而產生輸入位元流。即,在某些實施方式中,通過產生相應的輸出位元流(例如,可從發射器通訊裝置或從收發器通訊裝置的發射器部分發射的輸出位元流),可產生額外的冗餘,通過產生輸入位元流,可進行適當的處理。總之,這種視訊解碼結構用於處理輸入位元流,從而產生輸出視訊信號,該信號盡可能密切地並且在理想的情況下完全地與原始輸入視訊信號對應,用於輸出到一個或多個視訊顯示功能裝置中。 參考圖9的實施方式900,一般而言,通過執行在視訊編碼器結構內執行的編碼互補處理,熵解碼器等解碼器(根據CABAC、CAVLC等等可執行的解碼器)處理輸入位元流。輸入位元流盡可能密切地並且在理想的情況下完全地可視為視訊編碼器結構所產生的壓縮輸出位元流。當然,在實際應用中,在通過一個或多個通訊鏈路發射的信號內可能產生某些誤差。熵解碼器處理輸入位元流並且獲取合適的係數,例如DCT係數(例如,表示色度、亮度等資訊),並且將這種係數提供給反量化和反變換區塊。使用DCT變換時,反量化和反變換區塊可用於進行反DCT(IDCT)操作。然後,一種A/D閉塞濾波器用於產生與輸出視訊信號相應的各個幀和/或畫面。這些幀和/或畫面可提供給畫面緩衝器或數位畫面緩衝器(DPB),用於執行其他操作,包括移動補償。一般而言,這種移動補償操作可視為對應於與視訊編碼相關的幀間預測。同樣,也可在反量化和反變換區塊中輸出的信號上進行幀內預測。與視訊編碼相似,通過將輸入位元流解碼,在未對其進行幀內預測或幀間預測、對其進行幀內預測或進行幀間預測之間,這種視訊解碼器結構可用於執行模式選擇,從而產生輸出視訊信號。 參考圖10的實施方式100,在某些優選的實施方式中,根據用於產生輸出位元流的視訊編碼,可使用一個或多個環路內濾波器(例如,根據樣本自適應偏置(SAO)濾波器、自適應環路濾波器(ALF)、和/或任何其他的濾波器類型進行使用),並且在視訊解碼器結構內相應地使用一個或多個環路內濾波器。在一個實施方式中,在解除閉塞之後,適當地使用一個或多個這種環路內濾波器。 圖11顯示了遞迴(recursive)編碼單元(CU)結構的一個實施方式1100。高性能視訊編碼(HEVC)為目前正在研發的下一代視訊壓縮標準。在某些業內人士看來,HEVC標準似乎是H.264/MPEG4-AVC(或者稱為AVC)的延續,參考上文並且通過引用的方式包含在上文中。通過根據目前正在研發的HEVC標準進行視訊編碼,使用編碼單元或CU進行操作,作為基本單元,該基本單元通常具有方形,並且根據AVC,其對等物為巨集區塊(MB)。從某些角度來看,CU與MB以及AVC內相應的子巨集區塊(SMB)具有類似的操作目的和作用。然而,進行視訊編碼所使用的這兩個元件之間具有至少一個不同之處,CU可具有多個不同尺寸中的任一個尺寸,各個尺寸沒有特別的區別。相對於CU,即,最大的編碼單元(LCU)和最小的容量單元(SCU),將根據目前正在研發的HEVC標準執行的視訊通話術語限定為特定的術語。 根據視訊編碼,使用多個非重疊的LCU表示畫面。由於假設將CU限制為方形,所以LCU內的CU結構可表示成遞迴樹示意圖,如圖11中所示。即,CU的特徵在於在LCU內具有該LCU所屬的相應LCU尺寸和分級深度。 一旦在圖11中檢測了樹分裂處理,則為未進一步分離的每個CU規定不同的預測編碼方法。換言之,CU分級樹可包括多個葉節點,每個葉節點對應於各個樹分離處理,該處理用於與畫面對應的各個CU。根據視訊編碼,尤其相對於P和B切片,通過視訊編碼,每個CU可使用幀內預測或幀間預測。例如,如下圖以及圖7和圖8中所述,幀間預測編碼進行操作,從而參考相鄰幀,而幀內預測編碼進行操作,從而參考空間上相鄰的像素或共同定位的彩色元件。 圖12顯示了預測單元(PU)模式的實施方式1200。圖12尤其顯示了PU分割模式,分別用於具有尺寸2N×2N的CU。N×N PU與其他PU模式不同,並且僅存在於SCU內或最小的CU內。 根據目前正在研發的HEVC標準,使用不同的切片類型,即,I切片、P切片、以及B切片。一般而言,I幀進行操作使得例如根據預測,僅相對於該特定的幀進行處理(例如,I幀僅僅相對於其本身進行預測)。 P切片使用僅一個參考列表(list)而非各個參考列表進行操作。一般而言,對於P切片而言,根據移動補償,在幀序列的僅一個方向或單方向上進行預測。可在任何方向上根據P切片進行這種預測,但是在指定的時間僅僅使用一個方向。同樣,再次在幀序列的任一個方向,每次僅對一個幀進行P切片的預測。 一般而言,相對於B切片,可根據沿幀序列的兩個方向進行預測。可在幀序列的兩個方向同時使用例如根據移動補償的預測,使得除了目前幀,根據這種移動補償,還可使用至少兩個幀的資訊。例如,考慮在先前幀1和後面的幀3之間插入目前幀2:先前幀1可視為過去的幀,然而,後面的幀3可視為未來的幀或目前幀2之前的幀(例如,相對於幀序列)。可從先前幀1和/或後面的幀3中獲取資訊,用於處理目前幀2。同樣,通過處理目前幀2,從那兩個其他的幀中,可插入或混合某些資訊(例如,先前幀1的資訊可插入至或混合於以下幀3的資訊中)。同樣,相對於B切片,B切片可使用各個參考列表。通過使用B切片進行操作,使用單個語法元素(例如,如圖15中所示),可將PU分割模式內的CU預測模式共同進行編碼。根據目前CU是否為最小的CU、SCU,使用二值化。例如,如果未使用最小的CU或SCU,則通過使用下面的圖13中所述的修改的二元樹,可使用該二值化。 對於所使用的PU模式,將該資訊發射給解碼器,從而可適當地瞭解信號區塊如何分割並且適當地處理根據這個特定的PU模式編碼的視訊信號。例如,根據將視訊信號進行編碼時所使用的特定的PU模式,將該資訊提供給解碼器,從而該解碼器可適當地處理所接收的視訊信號並將其解碼。 圖13顯示了針對在一個實現方式中進行P切片編碼並且在另一實現方式中進行P切片和B切片編碼所採用的二元樹的一個實施方式,包括二元樹的修改。從該圖中可見,顯示了表示二值化和PU分割符號的二元樹。例如,與2N×2N對應的分割使用單個數位的編碼字(codeword),即,1。與2N×N對應的分割使用兩個數位的編碼字,即,01。與2N×N對應的分割使用三個數位的編碼字,即,001,並且與N×N對應的分割使用三個數位的編碼字,即,000。應當注意的是,可根據Huffman編碼來實施這種編碼,所以具有相應更低的概率的那些值具有較長的編碼字,而具有相應更高的概率的那些值具有較短的編碼字。可理解的是,根據這種Huffman編碼進行操作的系統可有效地使用較短的編碼字,用於更頻繁發生的以及具有更大優勢的值。 在某些實施方式中,不特別使用與N×N對應的分割,並且同樣,與表示Ms.的二元樹相關的編碼簿(codebook)可修改為僅包括三個條目。例如,在這種修改過的二元樹內,與2N×2N對應的分割使用單個數位的編碼字,即,1。同樣,與2N×N對應的分割使用兩個數位的編碼字,即,01。與2N×N對應的分割使用兩個數位的編碼字,即,00。可見,通過使用這種修改過的二元樹,Huffman編碼簿可具有更高的使用效率。此外,如上所述,對於B切片而言,B切片可使用各個參考列表。通過使用B切片進行操作,使用一個語法元素對PU分割模式內的CU預測模式共同進行編碼(例如,如圖11中所示)。根據目前CU是否為最小的CU、SCU,使用二值化。例如,如果未使用最小的CU或SCU,則通過使用下面圖13中所述的修改過的二元樹,可使用該二值化。 在可選的實施方式中,圖13中所示的二元樹用於B切片和P切片。即,在這種實施方式中,相同的二元樹用於B切片和P切片。這種實施方式中可理解的是,B切片和P切片使用同一個二元樹,可實現非常有效的實施方式,這是因為,僅單個編碼簿可用於處理B切片和P切片。換言之,在某些實施方式中,使用圖13中所示的二元樹,可進行B切片編碼和P切片編碼(例如,同一個二元樹用於B切片和P切片)。換言之,圖13的二元樹主要用於在一個實施方式中進行P切片編碼,該二元樹在可選的實施方式中可用於進行B切片編碼和P切片編碼。 在這種實施方式中,單獨的語法元素可用於CU預測模式(進行幀間預測或幀內預測)以及PU分割模式。例如,第一語法元素可用於表示幀內預測處理或幀間預測處理,第二語法元素可用於表示CU分割形狀(例如,表示如何進行CU分裂和分割)。 圖14顯示了可用於在一個實施方式中進行B切片編碼以及在另一個實施方式中進行P和B切片編碼的二元樹的實施方式1400。如上所述,對於B切片而言,B切片可使用各個參考清單。通過使用B切片進行操作,使用單個語法元素將PU分割模式內的CU預測模式共同進行編碼(例如,如圖14中所示)。 在一個實施方式中,圖14中所示的二元樹用於B切片,並且圖13和圖15的右手部分所示的修改過的二元樹用於P切片。可理解的是,在這種實施方式中,與圖13的左手邊所示的PU分割的二元樹相比,通過更有效地使用修改過的二元樹(例如,圖13和圖15的右手部分),以較低的費用可更有效地進行視訊編碼。可理解的是,在該實施方式中,兩個不同的單獨的編碼簿分別用於B切片(例如,圖13和圖15的右手部分)以及P切片(例如,圖14)。 在可選的實施方式中,圖14中所示的二元樹用於B切片和P切片。即,在這種實施方式中,同一個二元樹用於B切片和P切片。這種實施方式中可理解的是,使用用於B切片和P切片的同一個二元樹,可實現非常有效的實施方式,這是因為,僅僅單個編碼簿可用於處理B切片和P切片。換言之,在某些實施方式中,使用圖14中所示的二元樹,可進行B切片編碼和P切片編碼(例如,同一個二元樹用於B切片和P切片)。換言之,圖14的二元樹主要用於在一個實施方式中進行B切片編碼,該二元樹在可選的實施方式中可用於進行B切片編碼和P切片編碼。 圖15顯示了可用於與圖9中一樣進行P切片編碼以及B切片編碼的二元樹的實施方式1500。為了便於對讀者進行說明,圖15中再次用圖顯示圖13的右手部分所示的修改過的二元樹。在使用兩個不同的單獨的編碼簿的實施方式中,可使用這種修改過的二元樹,這兩個編碼簿分別用於B切片(例如,圖13和圖15的右手部分)以及P切片(例如,圖14)。 本文中所述的各種實施方式和/或示意圖中可理解的是,由於允許與N×N對應的分割僅僅用於最小的CU或SCU,所以各個分割不需要分別在根部位準(root level)和中間位準用於那些特定的CU中。對於P切片而言,編碼字分配(或二元樹結構/設計)用於與N×N對應的特定分割以及與N×N進入同一個分支內的分割尺寸(例如,在圖13內與N×2N對應的分割中可見),該編碼字分配應取決於其位準。如果目前的CU並非明確地為最小的CU或SCU,那麼圖13和圖15的右手部分所示的修改過的二元樹應適當地並且有效地與各個不同的PU分割的編碼字一致。因此,圖13的左手邊所示的二元樹需要僅僅用於P切片內最小的CU或SCU中。即,對於未明確地在P切片上進行操作的其他處理而言,可有效地減少和修改圖13的左手邊所示的二元樹,從而產生圖13以及圖15的右手部分所示的修改過的二元樹。 同樣,也如上所述,根據目前正在研發的HEVC標準,B切片和P切片分別使用不同的編碼字,用於不同的PU模式。根據P切片上的操作,使用單獨的語法元素,對CU預測模式(無論是執行幀間預測還是幀內預測)和PU分割模式進行編碼。然而,根據B切片上的操作,使用單個語法元素,對CU預測模式和PU分割模式共同進行編碼。在某些情況下,根據在其上操作P切片還是B切片,這個不同的處理可對語法分析造成額外的負擔。同樣,如上所述,使用二元樹執行一個可能的實施方式,如圖14中所示,用於B切片和P切片。即,在這種實施方式中,同一個二元樹用於B切片和P切片。這種實施方式中可理解的是,B切片和P切片使用同一個二元樹,可實現非常有效的實施方式,這是因為,僅單個編碼簿可用於處理B切片和P切片。例如,這種實施方式僅僅使用同一個二元樹進行操作,從而在這個特定的情況下統一處理B切片和P切片,並且也使用相同的方法發射CU預測模式和PU分割模式。可執行一個可能的實施方式,從而CU預測模式(無論是執行幀間預測還是幀內預測)和PU分割模式分別在單獨的語法元素內進行編碼,用於P切片和B切片。可執行另一個可能的實施方式,從而CU預測模式(無論是執行幀間預測還是幀內預測)和PU分割模式共同在單獨的語法元素內進行編碼,用於P切片和B切片。 本文中的各種實施方式和/或示意圖中可理解的是,可使用特定的應用程式中需要的各種不同的實施方式。在某些情況下,使用圖14中所示的共同的二元樹,統一進行處理,用於P切片和B切片。在其他情況下,兩個單獨實施的且不同的二元樹和編碼簿分別用於B切片和P切片時,並且尤其在未使用最小的CU或SCU(例如,目前的CU,而非SCU)時,圖13和圖15的右手部分所示的修改過的二元樹可用於P切片,而圖14中所示的二元樹可用於B切片。 圖16A、圖16B、圖17A以及圖17B顯示了通過視訊編碼所執行的方法的各種實施方式(例如,在一個或多個通訊裝置內)。 參考圖16A的方法1600,該方法1600通過操作視訊編碼器開始,以對輸入視訊信號編碼,從而產生輸出位元流,如步驟S1610內所示。方法1600繼續,根據產生該輸出位元流而在視訊編碼器內使用單個二元樹,以處理至少一個P切片和至少一個B切片,如步驟S1620內所示。 參考圖16B的方法1601,該方法1601通過操作視訊編碼器開始,以對輸入視訊信號編碼,從而產生輸出位元流,如步驟S1611內所示。 然後,方法1601進行操作,根據產生該輸出位元流而在視訊編碼器內針對至少一個P切片和至少一個B切片使用單個二元樹,以用單個語法元素來對編碼單元(CU)預測和預測單元(PU)分割模式共同地編碼,如步驟S1621內所示。 參考圖17A的方法1700,該方法1700開始時,操作視訊編碼器,以便對輸入視訊信號編碼,從而產生輸出位元流,如步驟S1710內所示。方法1700繼續,根據產生該輸出位元流而在視訊編碼器內針對至少一個P切片和至少一個B切片使用單個二元樹,以用第一語法元素對編碼單元(CU)預測進行編碼,如步驟S1720內所示。 然後,方法1700進行操作,根據產生該輸出位元流而在視訊編碼器內針對至少一個P切片和至少一個B切片使用單個二元樹,以用第二語法元素對預測單元(PU)分割模式進行編碼,如步驟S1730內所示。如本文中的其他實施方式和/或示意圖所述,單獨的語法元素可用於CU預測模式(無論是執行幀間預測還是幀內預測)以及PU分割模式。例如,第一語法元素可用於表示幀內預測處理或幀間預測處理,第二語法元素可用於表示CU預測形狀(例如,表示如何執行CU分裂和分割)。 參考圖17A的方法1701,該方法1701開始時,操作視訊編碼器,以便將輸入視訊信號編碼,從而產生輸出位元流,如步驟S1711內所示。 方法1701繼續,通過通訊通道,將輸出位元流或輸出位元流中產生的或與輸出位元流對應的信號發射給視訊解碼器,如步驟S1721內所示。例如,在通訊通道的發射器端,在某些實施方式中,輸出位元流可進行各種操作(例如,任何需要的類比和/或數位操作,包括過濾、縮放、頻移、頻率變換、捨入(rounding)、數位/類比變換等等),從而產生適合於和適用於通過通訊通道傳輸的信號。即,輸出位元流可進行多種發射器前端處理操作(例如,在類比前級電路(AFE)內),包括調變、連續式時間信號產生等等,以便產生實際上通過通訊通道發射的信號。在其他實施方式中,無需進行修改,實際上就可通過通訊通道發射輸出位元流本身。 然後,方法1701進行操作,操作視訊解碼器,從而將輸入位元流解碼(例如,穿過通訊通道之後,輸出位元流或由輸出位元流產生的信號或對應於輸出位元流的信號),以便產生一輸出視訊信號(例如,該輸入視訊信號之重新產生的版本),如步驟S1731內所示。例如,同樣,在通訊通道的發射器端,在某些實施方式中,要注意的是,在所接收的信號上可進行任何額外的處理(例如,任何需要的類比和/或數位操作,包括過濾、縮放、頻移、頻率變換、捨入、類比/數位變換等),從而產生進行視訊解碼的信號(例如,輸入位元流)。即,從通訊通道中所接收的實際信號可進行多種接收器前端處理操作(例如,在類比前級電路(AFE)內),包括調變等,以便產生進行視訊解碼的信號(例如,輸入位元流)。當然,在某些可選的實施方式中,未進行修改,實際上通過通訊通道發射輸出位元流本身時,不需要進行任何這種接收器前端處理操作。 也要注意的是,在通訊裝置內可執行各種方法中所述的各種操作和功能,例如使用基頻處理模組和/或其內執行的處理模組和/或其內的其他模組。 本文中可使用的術語“大致”和“大約”為其相應的術語提供工業上可接受的容差和/或物品之間的相關性。這種工業上可接受的容差的範圍從不到1%到50%,並且對應於但不限於元件值、積體電路處理變化、溫度變化、升降時間和/或熱雜訊。物品之間的這種相關性的範圍從幾個百分比的差別到大幅的差別。本文中也可使用的術語“可操作地耦合到”、“耦合到”、和/或“耦合”包括物品之間的直接耦合和/或物品之間通過中間物品(例如,物品包括但不限於元件、部件、電路和/或模組)進行間接耦合,其中,對於間接耦合而言,中間物品未修改信號資訊,但是可調整其電流位準、電壓位準和/或功率位準。本文中可進一步使用的推斷耦合(例如,一個部件與另一個部件通過推斷而耦合)包括在兩個物品之間進行直接和間接耦合,其方式與“耦合到”相同。本文中甚至可進一步使用的術語“可操作到”或“可操作地耦合到”表示物品包括一個或多個功率連接、輸入、輸出等等,以便在啟動時,執行一個或多個其相應的功能,並且可進一步包括推斷耦合到一個或多個其他的物品。本文中依然可進一步使用的術語“相關聯”表示單獨的物品和/或嵌入另一個物品內的一個物品進行直接和/或間接耦合。本文中可使用的術語“有利地比較”表示兩個或多個物品、信號等等之間的比較提供所需要的關係。例如,所需要的關係為信號1的幅度比信號2的幅度更大時,信號1的幅度比信號2的幅度更大或信號2的幅度比信號1的幅度更小時,可進行有利的比較。 本文中也可使用的術語“處理模組”、“模組”、“處理電路”、和/或“處理單元”(例如,包括可操作、執行和/或用於編碼、解碼、用於進行基頻處理等等的各種模組和/或電路),可為一個處理裝置或多個處理裝置。這種處理裝置可為微處理器、微控制器、數位信號處理器、微電腦、中央處理單元、現場可編程閘陣列、可編程邏輯裝置、狀態機、邏輯電路、類比電路、數位電路、和/或根據電路的硬編碼和/或操作指令來操縱(類比或數位)信號的任何裝置。處理模組、模組、處理電路和/或處理單元可具有相關的記憶體和/或積體記憶體部件,可為單個記憶體裝置、多個記憶體裝置、和/或處理模組、模組、處理電路和/或處理單元的嵌入式電路。這種記憶體裝置可為唯讀記憶體(ROM)、隨機存取記憶體(RAM)、揮發性記憶體、非揮發性記憶體、狀態機、動態記憶體、快閃記憶體、高速記憶體(cache)、和/或儲存數位資訊的任何裝置。要注意的是,如果處理模組、模組、處理電路和/或處理單元包括一個以上的處理裝置,那麼可集中地定位(例如,通過有線和/或無線匯流排結構直接耦合在一起)或分佈地定位(例如,通過區域網路和/或廣域網進行間接耦合,從而進行雲計算)這些處理裝置。而且,要注意的是,如果處理模組、模組、處理電路和/或處理單元通過狀態機、類比電路、數位電路、和/或邏輯電路執行一個或多個功能,那麼儲存相應的操作指令的記憶體和/或記憶體部件可嵌入包括狀態機、類比電路、數位電路、和/或邏輯電路的電路內或位於該電路的外部。依然要注意的是,記憶體部件可儲存指令並且處理模組、模組、處理電路和/或處理單元執行硬編碼的和/或操作的指令,這些指令與一個或多個圖中所示的至少一些步驟和/或功能相應。這種記憶體裝置或記憶體部件可包含在製品內。 上面已經借助於顯示特定功能和其關係的性能的方法步驟,描述了本發明。為了便於描述,在本文中已經任意地限定了這些功能性構件和方法步驟的界限和順序。只要適當地執行所規定的功能和關係,就可限定替代的界限和順序。任何這種替代的界限和順序因此是在所要求的本發明的範圍和精神內。而且,為了便於描述,已經任意地限定了這些功能性構件的界限。只要適當地執行某些重要的功能,就可限定替代的界限。同樣,在本文中也已經任意地限定了區塊流程圖,以便顯示某些重要的功能。在某種使用的程度上,可另外限定區塊流程圖的界限和順序,並且依然執行某個重要的功能。功能性構件和區塊流程圖的這種可選的定義因此在所要求的本發明的範圍和精神內。本領域的技術人員也會認識到,如圖所示,或通過離散元件、專用積體電路、執行適當的軟體等等的處理器、或其任意組合,可執行其內的功能性構件以及其他顯示性區塊、模組和元件。 在一個或多個實施方式中,也已經至少部分描述了本發明。本發明的一個實施方式在本文中用於顯示本發明、本發明的一個方面、其功能、其概念、和/或其實例。裝置、製品、機器、和/或體現本發明的處理的物理實施方式可包括一個或多個方面、功能、概念、和/或實例,在本文中所討論的一個或多個實施方式中進行了描述。而且,在所有圖中,這些實施方式可包含具有相同或相似名稱的功能、步驟、模組等等,可使用相同或不同的參考數位,同樣,這些功能、步驟、模組等等可為相同或相似的或不同的功能、步驟、模組等等。 除非明確地與規定相反,否則在本文中所示的任何一幅圖中,發射給部件的信號、從部件中發射的信號、和/或部件之間的信號可為類比或數位、連續時間或離散時間信號、以及單端信號或差分信號。例如,如果將信號路徑顯示為單端路徑,那麼該信號路徑也表示差分信號路徑。同樣,如果將信號路徑顯示為差分路徑,那麼該信號路徑也表示單端信號路徑。本領域的技術人員會認識到,在本文中描述一個或多個特定的結構的同時,也可使用其他結構,這些結構使用未明確顯示的一個或多個資料匯流排、部件之間的直接連接、和/或其他部件之間的間接耦合。 在描述本發明的各種實施方式時,使用術語“模組”。模組包括功能區塊,通過硬體使用該功能區塊,從而執行一個或多個模組功能,例如處理一個或多個輸入信號,以便產生一個或多個輸出信號。執行模組的硬體本身可結合軟體和/或韌體進行操作。本文中所使用的模組可包含一個或多個子模組,這些子模組本身為模組。 在本文中已經明確描述本發明的各種功能和特徵的特定組合的同時,這些特徵和功能也能具有其他組合。本發明不受到本文中所公開的特定實例的限制,並且明確包含這些其他的組合。 100、200‧‧‧通訊系統 110、120‧‧‧裝置 112、126、297‧‧‧發射器 114、128、222‧‧‧編碼器 116、122、298‧‧‧接收器 118、124、280‧‧‧解碼器 130‧‧‧衛星通訊通道 132、134‧‧‧衛星天線 140‧‧‧無線通訊通道 142、144‧‧‧塔 150‧‧‧有線通訊通道 152、154‧‧‧本地天線 160‧‧‧光纖通訊通道 162‧‧‧電光介面 164‧‧‧光電介面 199、299‧‧‧通訊通道 201‧‧‧資訊位元 202‧‧‧編碼的資訊位元 203‧‧‧離散值調變符號 204‧‧‧連續時間傳輸信號 205‧‧‧濾波的連續時間傳輸信號 206‧‧‧連續時間接收信號 207‧‧‧濾波的連續時間接收信號 208‧‧‧離散時間接收信號 209‧‧‧度量 210‧‧‧離散值調變符號和資訊位元 220‧‧‧編碼器和符號映射器 224‧‧‧符號映射器 230‧‧‧發射驅動器 232‧‧‧數位/類比轉換器 234‧‧‧發射濾波器 260‧‧‧類比前級電路 262‧‧‧接收濾波器 264‧‧‧類比/數位轉換器 270‧‧‧度量產生器 280a、280b‧‧‧處理模組 301、302‧‧‧電腦 303、304‧‧‧電視機 305‧‧‧手持媒體單元 306‧‧‧機上盒 307‧‧‧播放器 308‧‧‧數位圖像處理裝置 400、500、600‧‧‧視訊編碼體系結構的各種實施方式 700‧‧‧幀內預測處理的一個實施方式 800‧‧‧幀間預測處理的一個實施方式 900、1000‧‧‧視訊解碼體系結構的各種實施方式 1100‧‧‧遞迴編碼單元結構的一個實施方式 1200‧‧‧預測單元模式的實施方式 1400‧‧‧進行P和B切片編碼的二元樹的實施方式 1500‧‧‧進行P切片編碼以及B切片編碼的二元樹的實施方式 1600、1601、1700、1701‧‧‧方法 S1610~S1621、S1710~S1731‧‧‧各個步驟流程 圖1和圖2顯示了通訊系統的各種實施方式;圖3A顯示了電腦的一個實施方式;圖3B顯示了筆記型電腦的一個實施方式;圖3C顯示了高解析度電視的一個實施方式;圖3D顯示了標準解析度電視的一個實施方式;圖3E顯示了手持媒體單元的一個實施方式;圖3F顯示了機上盒的一個實施方式;圖3G顯示了數位視訊光碟播放器的一個實施方式;圖3H顯示了通用數位圖像和/或視訊處理裝置的一個實施方式;圖4、圖5和圖6是顯示了視訊編碼結構的各種實施方式的示意圖;圖7是顯示了幀內預測處理的實施方式的示意圖;圖8是顯示了幀間預測處理的實施方式的示意圖;圖9和圖10是顯示了視訊解碼架構的各種實施方式的示意圖;圖11顯示了遞迴編碼單元結構的實施方式;圖12顯示了預測單元模式的實施方式;圖13顯示了針對在一個實現方式中進行P切片編碼並且在另一實現方式中進行P切片和B切片編碼所採用的二元樹的一個實施方式,包括二元樹的修改;圖14顯示了可針對在一個實現方式中進行B切片編碼以及在另一實現方式中進行P和B切片編碼所採用的二元樹的實施方式;圖15顯示了針對P切片編碼和可針對與圖12所執行的B切片編碼相結合所採用的二元樹的實施方式;圖16A、圖16B、圖17A以及圖17B顯示了根據視訊編碼(例如,在一個或多個通訊裝置內)執行的方法的各種實施方式。 100‧‧‧通訊系統 110、120‧‧‧裝置 112、126‧‧‧發射器 114、128‧‧‧編碼器 116、122‧‧‧接收器 118、124‧‧‧解碼器 130‧‧‧衛星通訊通道 132、134‧‧‧衛星天線 140‧‧‧無線通訊通道 142、144‧‧‧塔 150‧‧‧有線通訊通道 152、154‧‧‧本地天線 160‧‧‧光纖通訊通道 162‧‧‧電光介面 164‧‧‧光電介面 199‧‧‧通訊通道
权利要求:
Claims (10) [1] 一種裝置,包括:視訊編碼器,用於對輸入視訊信號進行編碼,以產生輸出位元流;並且其中:所述視訊編碼器使用單個二元樹用於隨著產生所述輸出位元流處理至少一個P切片和至少一個B切片;所述視訊編碼器針對所述至少一個P切片和所述至少一個B切片使用所述單個二元樹,以隨著產生所述輸出位元流用第一語法元素對編碼單元預測進行編碼;以及所述視訊編碼器針對所述至少一個P切片和所述至少一個B切片使用所述單個二元樹,以隨著產生所述輸出位元流用第二語法元素對預測單元分割模式進行編碼。 [2] 如申請專利範圍第1項所述的裝置,其中:所述第一語法元素表示幀內預測處理或幀間預測處理;以及所述第二語法元素表示編碼單元分割形狀。 [3] 如申請專利範圍第1項所述的裝置,其中:視訊編碼器隨著產生所述輸出位元流而在第一時間或在第一時間期間執行幀內預測處理;以及視訊編碼器隨著產生所述輸出位元流而在第二時間或在第二時間期間執行幀間預測處理。 [4] 如申請專利範圍第1項所述的裝置,其中:所述裝置為第一通訊裝置;並且進一步包括:第二通訊裝置,經由至少一個通訊通道與所述第一通訊裝置進行通訊,包含:輸入端,用於接收所述輸出位元流;以及視訊解碼器,用於對所述輸出位元流進行解碼,以產生與所述輸入視訊信號相對應的輸出視訊信號;並且其中:所述第二通訊裝置為電腦、筆記型電腦、高解析度電視、標準解析度電視、手持媒體單元、機上盒、以及數位視訊光碟播放器中的至少一個。 [5] 如申請專利範圍第1項所述的裝置,其中所述裝置為在衛星通訊系統、無線通訊系統、有線通訊系統、光纖通訊系統以及移動通訊系統中的至少一個內進行操作的通訊裝置。 [6] 一種裝置,包括:視訊編碼器,用於對輸入視訊信號進行編碼,以產生所述輸出位元流;並且其中:所述視訊編碼器使用單個二元樹,用於隨著產生所述輸出位元流來處理至少一個P切片和至少一個B切片。 [7] 如申請專利範圍第6項所述的裝置,其中所述視訊編碼器針對所述至少一個P切片和所述至少一個B切片使用所述單個二元樹,以隨著產生所述輸出位元流用單個語法元素對編碼單元預測和預測單元分割模式共同地編碼。 [8] 一種用於操作通訊裝置的視訊編碼器的方法,所述方法包括:操作視訊編碼器,用於對輸入視訊信號進行編碼以產生輸出位元流;以及在所述視訊編碼器內使用單個二元樹,用於隨著產生所述輸出位元流來處理至少一個P切片和至少一個B切片。 [9] 如申請專利範圍第8項所述的方法,還包括:在視訊編碼器內針對至少一個P切片和至少一個B切片使用所述單個二元樹,以隨著產生所述輸出位元流用單個語法元素對編碼單元預測和預測單元分割模式共同地編碼。 [10] 如申請專利範圍第8項所述的方法,還包括:針對所述至少一個P切片和所述至少一個B切片使用所述單個二元樹,以隨著產生所述輸出位元流用第一語法元素對編碼單元預測進行編碼;以及針對所述至少一個P切片和所述至少一個B切片使用所述單個二元樹,以隨著產生所述輸出位元流用第二語法元素對預測單元分割模式進行編碼。
类似技术:
公开号 | 公开日 | 专利标题 TWI504221B|2015-10-11|用於操作通訊裝置的視訊編碼器的裝置和方法 TWI542196B|2016-07-11|根據視頻編碼進行自適應環路濾波的設備及操作視頻編碼器的方法 JP6165798B2|2017-07-19|イントラ予測を使用したビデオ符号化 CA2913797C|2021-11-30|Rice parameter initialization for coefficient level coding in video coding process TWI542219B|2016-07-11|頻域取樣自適應偏移(sao) US10165285B2|2018-12-25|Video coding tree sub-block splitting KR20130092514A|2013-08-20|비디오 코딩에 따른 샘플 적응적 오프셋| WO2014055345A1|2014-04-10|Intra-coding for 4:2:2 sample format in video coding JP2015511472A|2015-04-16|ビデオコード化におけるコードブックを使用したループフィルタパラメータのコード化 RU2580082C2|2016-04-10|Сигнализация элементов синтаксиса для коэффициентов преобразования для поднаборов единицы кодирования на уровне листьев KR20140028121A|2014-03-07|비디오 압축에서 계수 레벨 코딩을 위한 콘텍스트들 US20130343447A1|2013-12-26|Adaptive loop filter | padding in accordance with video coding US20120147970A1|2012-06-14|Codeword adaptation for variable length coding TWI524739B|2016-03-01|根據視頻編碼的採樣點自適應偏移(sao) US9231616B2|2016-01-05|Unified binarization for CABAC/CAVLC entropy coding KR101357842B1|2014-02-06|인프라스트럭쳐 성능들 및 현재 조건들에 기초한 비디오 코딩 서브-블록 사이징 US20130235926A1|2013-09-12|Memory efficient video parameter processing
同族专利:
公开号 | 公开日 CN103024373A|2013-04-03| CN103024373B|2016-12-21| KR20130033968A|2013-04-04| KR101419424B1|2014-07-15| EP2575366A3|2013-09-11| EP2575366B1|2019-09-11| EP2575366A2|2013-04-03| TWI504221B|2015-10-11| US20130077684A1|2013-03-28| US9332283B2|2016-05-03|
引用文献:
公开号 | 申请日 | 公开日 | 申请人 | 专利标题 TWI552579B|2013-04-19|2016-10-01|三星電子股份有限公司|視訊編碼方法與裝置以及非暫時性電腦可讀記錄媒體|US7433526B2|2002-04-30|2008-10-07|Hewlett-Packard Development Company, L.P.|Method for compressing images and image sequences through adaptive partitioning| US6900748B2|2003-07-17|2005-05-31|Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V.|Method and apparatus for binarization and arithmetic coding of a data value| US8239766B2|2005-09-27|2012-08-07|Qualcomm Incorporated|Multimedia coding techniques for transitional effects| TWI332799B|2006-09-13|2010-11-01|Realtek Semiconductor Corp|A video data source system and an analog back end device| US8503527B2|2008-10-03|2013-08-06|Qualcomm Incorporated|Video coding with large macroblocks| US7932843B2|2008-10-17|2011-04-26|Texas Instruments Incorporated|Parallel CABAC decoding for video decompression| CN102118615B|2010-01-05|2012-08-22|香港应用科技研究院有限公司|采用可变块大小略过模式的视频编/解码方法和装置| US8995527B2|2010-02-19|2015-03-31|Qualcomm Incorporated|Block type signalling in video coding| US9973768B2|2010-03-16|2018-05-15|Texas Instruments Incorporated|CABAC decoder with decoupled arithmetic decoding and inverse binarization| CN101990104A|2010-11-17|2011-03-23|中兴通讯股份有限公司|视频图像编码方法及装置|EP2740263B1|2011-09-16|2019-02-27|HFI Innovation Inc.|Method and apparatus for prediction mode and partition mode syntax coding for coding units in hevc| US20130121417A1|2011-11-16|2013-05-16|Qualcomm Incorporated|Constrained reference picture sets in wave front parallel processing of video data| US20140029670A1|2012-07-27|2014-01-30|Motorola Mobility Llc|Devices and methods for processing of partition mode in high efficiency video coding| US9516306B2|2013-03-27|2016-12-06|Qualcomm Incorporated|Depth coding modes signaling of depth data for 3D-HEVC| US9369708B2|2013-03-27|2016-06-14|Qualcomm Incorporated|Depth coding modes signaling of depth data for 3D-HEVC| CN110365976A|2013-11-14|2019-10-22|寰发股份有限公司|利用基于帧内图片区块复制预测的视频编码方法| CN105594211B|2013-11-27|2019-03-15|寰发股份有限公司|用于图片的包括帧内区块复制模式的编码模式的发送方法| CN106576169A|2014-09-30|2017-04-19|寰发股份有限公司|深度编码中用于深度建模模式的查找表尺寸减小的方法| WO2016074147A1|2014-11-11|2016-05-19|Mediatek Singapore Pte. Ltd.|Separated coding tree for luma and chroma| US10382795B2|2014-12-10|2019-08-13|Mediatek Singapore Pte. Ltd.|Method of video coding using binary tree block partitioning| WO2016090568A1|2014-12-10|2016-06-16|Mediatek Singapore Pte. Ltd.|Binary tree block partitioning structure| WO2017008263A1|2015-07-15|2017-01-19|Mediatek Singapore Pte. Ltd.|Conditional binary tree block partitioning structure| WO2017114450A1|2015-12-31|2017-07-06|Mediatek Inc.|Method and apparatus of prediction binary tree structure for video and image coding| US20170244964A1|2016-02-23|2017-08-24|Mediatek Inc.|Method and Apparatus of Flexible Block Partition for Video Coding| EP3306938A1|2016-10-05|2018-04-11|Thomson Licensing|Method and apparatus for binary-tree split mode coding| CN108781286A|2016-12-26|2018-11-09|日本电气株式会社|视频编码方法、视频解码方法、视频编码设备、视频解码设备以及程序| JPWO2018123312A1|2016-12-26|2019-10-31|日本電気株式会社|映像符号化方法、映像復号方法、映像符号化装置、映像復号装置及びプログラム| KR20180110064A|2016-12-26|2018-10-08|닛본 덴끼 가부시끼가이샤|영상 인코딩 방법, 영상 디코딩 방법, 영상 인코딩 장치, 영상 디코딩 장치, 및 프로그램| WO2018135885A1|2017-01-19|2018-07-26|가온미디어 주식회사|변환 처리를 제공하는 영상 복호화 및 부호화 방법| KR20210087450A|2018-11-06|2021-07-12|베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드|기하학적 파티션을 이용한 인터 예측을 위한 사이드 정보 시그널링| CN109348276B|2018-11-08|2019-12-17|北京微播视界科技有限公司|视频画面调整方法、装置、计算机设备和存储介质| KR20210107864A|2019-06-26|2021-09-01|텐센트 아메리카 엘엘씨|포인트 클라우드 코딩을 위한 암시적 4진트리 또는 2진트리 지오메트리 파티션|
法律状态:
优先权:
[返回顶部]
申请号 | 申请日 | 专利标题 US201161539948P| true| 2011-09-27|2011-09-27|| US13/523,822|US9332283B2|2011-09-27|2012-06-14|Signaling of prediction size unit in accordance with video coding| 相关专利
Sulfonates, polymers, resist compositions and patterning process
Washing machine
Washing machine
Device for fixture finishing and tension adjusting of membrane
Structure for Equipping Band in a Plane Cathode Ray Tube
Process for preparation of 7 alpha-carboxyl 9, 11-epoxy steroids and intermediates useful therein an
国家/地区
|